Mô hình dự báo giá cà phê của sinh viên RMIT

Dự đoán giá cà phê có thể hỗ trợ nông dân đưa ra quyết định về mùa vụ, lập kế hoạch phù hợp, tối ưu lợi nhuận và giảm thiểu tổn thất. Ảnh: NVCC

Trợ giúp nông dân lập kế hoạch mùa vụ

Việt Nam là nước xuất khẩu cà phê lớn thứ hai thế giới và đóng góp hơn một nửa nguồn cung cà phê Robusta toàn cầu. Sản lượng cà phê niên vụ 2022 - 2023 đạt 29,75 triệu bao, trong đó Robusta chiếm hơn 95%.

Trong Đánh giá thường niên 2021 - 2022 của Tổ chức Cà phê quốc tế, Việt Nam đứng đầu về năng suất canh tác cà phê với 2,4 tấn/ha. Sản lượng cà phê được tạo thành từ hạt Robusta, Arabica, Cherri, Moka và Culi, là những loại cà phê phổ biến nhất được trồng ở Việt Nam.

Tuy nhiên, giá cả các mặt hàng nông sản nói chung và giá hạt cà phê nói riêng thường không ổn định và có thể biến động mạnh vào thời điểm bội thu, khiến thu nhập của nông dân bị tác động đáng kể và gây thiệt hại cho nền kinh tế.

Nghiên cứu giải pháp cho vấn đề này, trong khoảng thời gian 4 tháng, một nhóm sinh viên năm cuối ngành Cử nhân Công nghệ thông tin, Khoa Khoa học, Kỹ thuật và Công nghệ, Trường Đại học RMIT, gồm Nguyễn Hải Minh Trang, Đoàn Chánh Thống, Lê Ngọc Nguyên Thuần, Nguyễn Phương Nam và Lâm Tín Diệu, đã huấn luyện, đánh giá 6 mô hình học máy (machine learning - ML) để dự đoán giá cà phê, có thể hỗ trợ nông dân Việt Nam đưa ra quyết định về mùa vụ và lập kế hoạch phù hợp, tối ưu lợi nhuận, giảm thiểu tổn thất.

“Chúng em đã phát triển sáu mô hình ML dựa trên lịch sử giá cà phê, giá xăng dầu, nhiệt độ và lượng mưa, để dự đoán giá cà phê Robusta ở tỉnh Lâm Đồng và nhận thấy mô hình RF (Random Forests), sử dụng toàn bộ bộ dữ liệu là hiệu quả nhất.

RF có thể kết hợp bộ dữ liệu phong phú hơn và xử lý được mối quan hệ phi tuyến. Ngoài ra, giá nhiên liệu cho thấy là một yếu tố dự báo quan trọng, vượt trội so với tất cả các tính năng được thử nghiệm khác kết hợp lại”, Nguyễn Hải Minh Trang chia sẻ.

Kết quả nghiên cứu được trình bày tại Hội nghị quốc tế IEEE/ACIS lần thứ 8 về Dữ liệu lớn, Điện toán đám mây và Kỹ thuật khoa học dữ liệu (BCD 2023) - cùng với các nhà nghiên cứu, khoa học, kỹ sư và chuyên gia tổ chức hồi tháng 12 tại TPHCM.

Tại đây các chuyên gia đã góp ý nhằm cải thiện độ chính xác và khả năng áp dụng các dự đoán của mô hình. “Chúng tôi dự định đi sâu hơn vào các kỹ thuật tiên tiến và các phương pháp mới nổi trong lĩnh vực này để củng cố hơn nữa kết quả nghiên cứu mà nhóm đã thực hiện được”, Đoàn Chánh Thống cho biết.

Nghiên cứu thêm dự báo năng suất cây trồng

Theo nhóm nghiên cứu, mô hình này có tiềm năng tiếp tục cải tiến bằng cách nghiên cứu và bổ sung thêm tác động của năng suất cây trồng, xu hướng thị trường và các sự kiện địa chính trị đến giá cả của nông sản.

Chia sẻ về khó khăn trong quá trình nghiên cứu, nhóm sinh viên cho biết mỗi thành viên trong nhóm phải đối mặt với những thách thức khác nhau trong quá trình thực hiện dự án. Chẳng hạn như hiểu biết chuyên sâu về các mô hình ML khác nhau, truyền đạt hiệu quả độ phức tạp của những gì các bạn thực hiện sang trang miền AI, hoặc quản lý thời gian và sự trao đổi khi làm việc từ xa.

“Tuy nhiên, bằng cách đầu tư thời gian đáng kể vào nghiên cứu, đào sâu vào các bài báo nghiên cứu liên quan đến AI và ML, đồng thời nâng cao kỹ năng kỹ thuật và cộng tác, các bạn đã cải thiện kỹ năng nghiên cứu AI cho các vấn đề trong thế giới thực và có khả năng phát triển nghiên cứu của nhóm thành sản phẩm thực tế”, Trang chia sẻ.

Thách thức chủ yếu đối với nhóm sinh viên xoay quanh việc thu thập và tích hợp dữ liệu. Mặc dù việc phát triển mô hình khá đơn giản, thời gian đáng kể cần phải đầu tư vào việc thu thập và kết hợp dữ liệu đã đặt ra trở ngại rất lớn cho nhóm. Mỗi thành viên trong nhóm đã trải qua các cung bậc học hỏi và tiến bộ vượt bậc cả về kỹ năng chuyên ngành và điều phối dự án, từ nghiên cứu chuyên sâu, đến đẩy mạnh đổi mới, đưa ra các giải pháp.

Vào thời điểm thực hiện nghiên cứu, Nguyễn Phương Nam làm việc từ Hà Nội và đã đi làm toàn thời gian. Để phòng ngừa việc chậm tiến độ và những gián đoạn tiềm ẩn, Nam cho biết cả nhóm đã thiết lập các cuộc họp hằng tuần, duy trì liên lạc thường xuyên, vừa để động viên nhau đi đúng hướng, vừa hoàn thành tốt khối lượng công việc được giao.

Nhóm nghiên cứu có kế hoạch tinh chỉnh các mô hình dựa trên phản hồi các bạn nhận được từ phần thuyết trình trong hội nghị, đồng thời cũng tìm hiểu thêm các hướng tiếp cận khác để cải thiện độ chính xác và khả năng áp dụng các dự đoán của họ.

“Chúng em dự định đi sâu hơn vào các kỹ thuật tiên tiến và các phương pháp mới nổi trong lĩnh vực này để củng cố hơn nữa kết quả nghiên cứu mà nhóm đã thực hiện được. Bên cạnh đó, chúng em dự kiến sẽ hợp tác với các chuyên gia khác trong lĩnh vực và khai thác các quan hệ đối tác tiềm năng để mở rộng phạm vi, tác động kết quả nghiên cứu của nhóm”, Thống cho biết.

Nhật Chi